Ames Fire Insurance
🔥 우리는 LS 화재보험사

에임즈(Ames) 시에 새로운 보험상품을 출시하려 합니다.
그런데 이 지역은 화재 위험도가 어떤지,
보험금은 얼마로 책정해야 수익이 날 수 있을지,
아무도 정확히 모릅니다.

  • 📦 주택 가격은 어떤지
  • 🧱 자재는 화재에 강한지
  • 🔥 위험 지역은 어디인지
  • 💰 보험 수익은 어디서 발생하는지
이제 데이터를 기반으로,
에임즈 시의 보험료를 직접 산정해보겠습니다.
📌 프로젝트 배경

최근 기후 변화노후화된 주택 문제로,
미국 내 화재 사고가 증가하고 있습니다.
캘리포니아 산불 사례처럼, 보험사는 막대한 손실을 입을 수 있습니다.

그렇다면, 우리는 사전 예측과 리스크 분석을 통해
보다 정밀한 보험료 책정이 가능할까요?

Ames Housing 데이터를 기반으로
데이터 기반 화재보험 모델을 구축합니다.
🧭 분석 흐름 요약

1️⃣ 화재 위험 시각화
2️⃣ 화재 대응 자원 분석
3️⃣ 피해액 예측 모델링
4️⃣ 보험금 산정 공식 설계
5️⃣ 추천 리스트 & 정책 제안

🗺️ 1. 위험도 기반 주택 시각화
📋 2. 화재 위험도 산정 기준표
위험도1 위험도2 위험도3 위험도4 위험도5
지붕 자재 (30%) Metal CompShg, Tar&Grv Roll, Membran WdShngl WdShake
외벽 재질(30%) MetalSd, CemntBd, BrkFace… ImStucc,Stucco VinylSd, HdBoard, AsphShn Wd Sdng, WdShing, Plywood
외벽 장식 재질(10%) MetalSd,CemntBd,BrkFace… Stucco, ImStucc VinylSd HdBoard, AsphShn Wd Sdng, WdShing, Plywood
외벽 마감재(10%) BrkFace,Stone,BrkCmn
목재 바닥 넓이(20%) 0 1~100 101~250 251~400 400
  • 지붕과 외벽은 화재 시 가장 먼저 타는 1차적 취약 요소입니다.
  • 목재 바닥은 불씨에 쉽게 착화되며,
  • 외벽 마감재와 장식은 상대적으로 위험도는 낮지만 가연성일 경우 주의가 필요합니다.

📎 자세한 기준은 NFPA 공식 가이드에서 확인할 수 있습니다.
🔗 NFPA - Preparing Homes for Wildfire

📊 3. 위험도별 주택수량 막대그래프
📊 1. 가격 & 평단 가격 시각화
📐 2. 피트당 단가 (근거)

수식 보여주고 어떤 근거로 작성했는지 했을때 효과가 무엇인지 어떻게 보여줄건지

📉 3. 가격 분포 막대그래프
📝 1에 대한 해석
  • 건물 피해 단가 기반 보험료 산정이 타당함을 확인
  • 고가 주택일수록 피해 예상액이 커짐
🔥 분석 목적 요약

화재 위험 등급이 높을수록 주택 가격이 낮은가? 위험도와 가격 간의 관계를 통계적으로 검정하고, 그 결과를 시각화와 함께 해석합니다.

📊 아노바 검정 결과
  • ✅ 위험도별 가격 평균 차이 있음
  • ✅ Bartlett 등분산성 검정 통과
  • ✅ 사후검정(Dunnett’s Test): 일부 그룹 간 유의한 차이 존재
📈 위험도별 주택가격 Box Plot
🔍 결과 해석
  • 평균 가격:
    위험도 1 < 2 < 3 < … < 5
    위험도가 높을수록 평균 가격은 낮은 경향

  • 하지만,
    위험도가 낮다고 가장 비싼 집은 아님

  • 가격은 취향 차이, 재료, 위치 등의
    다양한 요인의 영향을 받음

📌 결론 요약
  • 🔥 화재 위험도는 가격에 통계적으로 유의미한 영향을 미칩니다.
  • 🏷️ 하지만, 가격은 단일 요인이 아닌 복합 요인의 결과입니다.
    (예: 부촌 = 안전 + 디자인 + 입지)
요소 설명
📌 Shapiro-Wilk 검정 p-value 박스 0.01 이하 → 정규성 부족 명시
📉 잔차 plot (fitted vs residual) 선형성 or 등분산성 확인 시 사용
🗂️ 필터 추가 위험도별/지역별 결과 필터링 가능
📌 분석 목적

거래가 없는 주택에도 적용 가능한 예측 모델을 통해 보험료를 산정합니다.

🔧 보험료 예측 모델
  • 사용 모델: Lasso, Ridge, ElasticNet
  • 주요 변수: 위험도, 자재, 노후도, 평단가 등
  • 성능 평가: R², RMSE, 교차검증
# 회귀 모델 학습 및 평가 코드
🗺️ 예측 보험료 지도 시각화
  • 각 주택의 보험료 예측값을 지도에 시각화
  • 색상 = 보험료 크기, Hover 시 상세 금액 표시
# Scattermapbox 지도 시각화 코드
💰 보험료 산정 공식

예상 보험료 = 예측 피해액 × 화재 위험 가중치 × 자재 손상률 × 노후도 계수

📌 분석 목적

에임즈 전체 보험료 총합과 보장 총액을 바탕으로 손익분기점을 분석합니다.

🎯 위험-수익 매트릭스 시각화

각 구역(또는 주택)을 위험도와 수익성 축으로 표현한 4분면 분석입니다.
수익이 낮고 위험이 높은 지역은 보험 인수 대상에서 제외하는 전략이 필요합니다.

📈 손익 시나리오 그래프
# x축: 보장 비율 (%)
# y축: 수익 또는 손실 (USD)
📌 결론 요약
  • 보험료 모델로 모든 주택의 보험료 산정 가능
  • 손익 시나리오 분석을 통해 수익 구조 명확화
  • 데이터 기반 보험 전략 수립 기반 마련